통합검색 > 통합검색 : 캐드앤그래픽스 - 엔지니어링IT 미디어

씨이랩, AI 엑스포에서 비전 AI 특화 제품 선보여

AI 영상 분석 전문기업인 씨이랩은 5월 1일~3일 서울 코엑스에서 열리는 ‘2024 국제인공지능대전(AI EXPO KOREA 2024)’을 통해 영상분야에 특화된 AI 제품을 선보였다고 전했다. 씨이랩은 이번 전시회에서 ▲AI 영상 분석 서비스 ‘비디고(VidiGo)’ ▲합성 데이터 생성 솔루션 ‘엑스젠(X-GEN)’ ▲쿠버네티스 기반 AI 플랫폼 ‘아스트라고(astrago)’ 등 자사의 비전 AI 기술이 적용된 주요 제품을 출품했다. 특히 씨이랩은 클라우드 기반 AI 영상분석 서비스 비디고의 신규 버전인 ‘비디고 서치엔진(VidiGo Search Engine)’을 공개했다. 비디고 서치엔진은 영상을 시청하지 않고도 검색을 통해 특정 객체나 장면을 AI가 빠르게 찾아낸다. 영상을 요약하거나 숏폼을 제작하는 ‘비디고 하이라이트(VidiGo Highlight)’의 후속 제품이다. 씨이랩의 최원준 리더는 “비디고 하이라이트는 누구나 쉽게 AI 영상 분석을 진행할 수 있도록 카카오톡 채널을 통해 출시한 반면, 비디고 서치엔진은 대규모의 영상을 보유한 기업을 타기팅하고 있다. 이번 행사에서 비디고의 주요 타깃인 미디어 산업 분야의 참관객들에게 높은 관심을 받았다”고 말했다. 한편, 씨이랩은 AI 엑스포의 부대행사로 ‘비전 AI의 현재와 미래’라는 주제의 세미나를 진행했다. 세미나에서 씨이랩의 채정환 부사장은 “현재의 AI 시장은 초거대 언어 모델(LLM) 중심으로 발전해왔고, 머지않아 초거대 비전 모델(LVM : Large Vision Model) 중심으로 확대될 것으로 전망한다”고 밝히며, 엔비디아 옴니버스 플랫폼과의 협력을 통한 LVM 구성 전략을 제시했다.

작성일 : 2024-05-03

RTX A400/A1000 : AI 기반 워크플로 강화하는 전문가용 GPU

개발 및 공급 : 엔비디아 주요 특징 : AI 처리를 위한 3세대 텐서 코어 및 레이 트레이싱을 위한 2세대 RT 코어 탑재, 암페어 아키텍처 기반의 CUDA 코어 탑재해 그래픽/컴퓨팅 처리속도 향상, 전문가 작업의 데이터를 처리속도 향상 위한 메모리 대역폭 증가, 효율적인 비디오 처리를 위한 인코딩/디코딩 엔진 탑재 등 엔비디아가 새로운 엔비디아 RTX A400과 RTX A1000 GPU를 통해 RTX 전문가용 그래픽 제품을 확장하고, 디자인을 비롯한 AI 기반 생산성 워크플로를 강화한다고 밝혔다. 디자인과 생산성 애플리케이션 전반에 걸친 AI 통합이 새로운 기준으로 자리잡으면서 고급 컴퓨팅 성능에 대한 수요가 증가하고 있다. 즉, 전문가와 크리에이터들은 프로젝트의 규모와 복잡성 또는 범위에 관계없이 향상된 컴퓨팅 성능을 활용해야 한다. 엔비디아 암페어(Ampere) 아키텍처 기반의 RTX A400과 RTX A1000 GPU는 이렇게 증가하는 수요를 충족하기 위해 개발됐으며, AI와 레이 트레이싱 기술에 대한 접근성을 확대해 전문가들이 일상적인 워크플로를 혁신하는데 필요한 도구를 제공한다. ▲ 엔비디아 RTX A400 향상된 성능으로 창의성 및 효율 향상 지원 RTX A400 GPU는 RTX 400 시리즈 GPU에 가속화된 레이 트레이싱과 AI를 도입했다. 이 GPU는 AI 처리를 위한 24개의 텐서 코어(Tensor Cores)를 탑재해 기존 CPU 기반 솔루션을 넘는 성능을 제공한다. 이를 통해 전문가들은 지능형 챗봇, 코파일럿과 같은 최첨단 AI 애플리케이션을 데스크톱에서 직접 실행할 수 있다. 또한 GPU는 실시간 레이 트레이싱을 제공하므로 크리에이터는 생생하고 물리적 정확도가 높은 3D 렌더링을 제작할 수 있다. A400은 시리즈 최초로 4개의 디스플레이 출력을 지원해 금융 서비스, 명령과 제어, 유통, 운송과 같은 산업에 필수적인 고밀도 디스플레이 환경에 적합하다. 엔비디아 RTX A1000 GPU는 RTX 1000 시리즈 GPU에 처음으로 텐서 코어와 RT 코어를 도입했다. 이를 통해 전문가와 크리에이터를 위한 가속화된 AI와 레이 트레이싱 성능을 제공한다. A1000은 72개의 텐서 코어를 탑재해 이전 세대에 비해 업그레이드된 성능을 갖췄다. 스테이블 디퓨전(Stable Diffusion)과 같은 도구에서 3배 이상 빠른 생성형 AI 프로세싱을 제공하며, 18개의 RT 코어는 그래픽과 렌더링 작업 속도를 최대 3배까지 높여 2D와 3D CAD, 제품과 건축 설계, 4K 비디오 편집과 같은 전문적인 워크플로를 가속화한다. 더불어 A1000은 이전 세대보다 최대 38% 더 많은 인코딩 스트림을 처리하고 2배 더 빠른 디코딩 성능을 제공하는 등 비디오 처리 능력을 높였다. ▲ 엔비디아 RTX A1000 차세대 기능을 통한 성능 강화 A400과 A1000 GPU는 싱글 슬롯 디자인에 전력소비량이 50W이며, 콤팩트하고 에너지 효율적인 워크스테이션을 위해 향상된 기능을 제공한다. 2세대 RT 코어 : 건축 도면, 3D 디자인, 콘텐츠 제작 등 모든 전문 워크플로를 위한 실시간 레이 트레이싱, 사실적인 물리 기반 렌더링과 시각화, 정확한 조명과 그림자 시뮬레이션으로 작업 품질을 높일 수 있다. 3세대 텐서 코어 : 생성형 AI, 이미지 렌더링 노이즈 제거, 딥러닝 슈퍼 샘플링과 같은 AI 증강 도구와 애플리케이션을 가속화해 이미지 생성 속도와 품질을 개선한다. 암페어 아키텍처 기반 쿠다 코어 : 암페어 아키텍처 기반의 쿠다(CUDA) 코어는 이전 세대 대비 최대 2배의 단정밀도 부동 소수점 처리량으로 그래픽과 컴퓨팅 워크로드의 속도를 크게 높인다. 4GB/8GB 메모리 : A400 GPU의 4GB와 A1000 GPU의 8GB GPU 메모리는 다양한 전문가용 요구 사항을 충족한다. 여기에는 기본적인 그래픽 디자인과 사진 편집부터 텍스처나 고해상도 편집, 데이터 분석이 필요한 까다로운 3D 모델링 등이 포함된다. 또한 이 GPU들은 이전 세대보다 메모리 대역폭이 증가해 데이터를 더 빠르게 처리하고 대용량 데이터 세트와 장면을 더 원활하게 처리할 수 있다. 인코딩/디코딩 엔진 : 7세대 인코드(NVENC)와 5세대 디코드(NVDEC) 엔진을 탑재한 새 GPU는 효율적인 비디오 처리를 기능을 제공한다. 이를 통해 초저지연으로 고해상도 비디오 편집, 스트리밍, 재생을 지원한다. 또한 AV1 디코드가 포함돼 더 많은 비디오 포맷을 더 효율적이고 원활하게 재생할 수 있다. RTX 솔루션의 활용 범위 확대 엔비디아는 새로운 GPU가 최첨단 AI, 그래픽, 컴퓨팅 기능 등을 통해 사용자의 생산성을 높이고 창의적인 가능성을 열어준다고 전했다. 레이 트레이싱 렌더링과 AI가 포함된 고급 워크플로를 통해 전문가들은 작업의 한계를 뛰어넘고 놀라운 수준의 사실감을 구현할 수 있다. 기획 담당자들은 강력하고 에너지 효율적인 새로운 컴퓨팅 솔루션을 에지 배포에 사용할 수 있다. 크리에이터는 편집과 렌더링 속도를 높여 더욱 풍부한 시각적 콘텐츠를 제작할 수 있다. 건축가와 엔지니어는 아이디어를 3D CAD 개념에서 실제 디자인으로 원활하게 전환할 수 있다. 스마트 공간에서 작업하는 경우에는 공간 제약이 있는 환경에서 실시간 데이터 처리, AI 기반 보안, 디지털 사이니지 관리 등에 GPU를 사용할 수 있다. 또한 의료 전문가들은 더 빠르고 정밀한 의료 영상 분석을 수행할 수 있다. ■ 기사 내용은 PDF로도 제공됩니다.

작성일 : 2024-05-02

[칼럼] 기업 성장 맵 - 엔비디아 편

작성일 : 2024-05-02

HP, 개인 맞춤형 AI 경험에 집중한 AI PC 포트폴리오 공개

HP가 하이브리드 작업 환경에서 생산성과 창의성을 높이고 최적화된 사용자 경험을 제공하기 위한 AI PC 포트폴리오를 공개했다. HP는 상업용과 소비자용 PC 전반에 AI 기술을 접목해 기업과 개인 사용자에게 최적화된 PC 경험을 제공하며 AI PC 분야에서 리더십을 강화하겠다고 밝혔다. 글로벌 시장조사 업체 마켓앤마켓에 따르면 AI는 오는 2030년까지 연간 36.8%로 큰 폭의 성장을 이룰 것으로 전망되고 있으며 그에 따른 수요도 빠르게 증가하는 추세다. 특히 엔데믹 이후 하이브리드 근무가 뉴노멀로 자리잡으면서, 업무 환경에서 AI가 가져올 변화를 기대하는 목소리도 높다. AI의 보급으로 소비자들이 생활 속에서 다양한 AI 기능을 활용하며, AI PC가 업계 내 주요 관심사로 떠올랐다. HP는 개인의 AI 경험에 방점을 둔 ‘나만의 AI PC’를 슬로건으로 내걸고, 엔드 포인트 사용자들의 다양한 요구에 맞춘 폭넓은 AI PC 포트폴리오를 선보였다. ‘나만의 AI PC’는 AI라는 혁신적인 기술이 가져올 변화도 중요하지만, 이를 사용하는 사용자에게 초점을 맞추고 개개인을 위한 맞춤 환경을 제공해 개인이 이뤄낼 수 있는 가능성과 잠재력을 끌어내겠다는 HP의 AI PC 로드맵을 담았다. HP는 기자간담회에서 AI 트렌드에 따라 변모한 PC 시장의 흐름을 공유하고 자사의 AI PC와 솔루션을 시연하는 한편 AI PC 혁신 전략을 공유했다. 전문가를 위한 워크스테이션, 하이브리드 근무에 최적화된 비즈니스 PC, 개인의 창의성을 높이는 소비자용 노트북, 향상된 플레이 경험을 제공하는 게이밍 노트북 제품에 AI 기술을 더해, 다양한 소비자들의 니즈에 맞춘 제품을 선보인다는 계획이다. HP는 개개인에게 최적화된 소비자용 AI PC 제품으로 투인원 노트북인 ‘HP스펙터x360 14(HP Spectre x360 14)’와 HP의 14인치 게이밍 노트북 중 가장 가벼운 제품인 ‘HP 오멘 14 슬림(HP OMEN 14 Slim)’ 제품을 소개했다. 360도 회전 기능을 통해 노트북에서 태블릿으로 모드를 변경할 수 있는 스펙터 x360 14는 고성능 AI 칩을 활용해 자리를 뜨면 화면이 자동으로 꺼지는 ‘워크 어웨이 잠금(Walk away lock)’, 가까이 다가가면 기기가 빠르게 켜지는 ‘웨이크 온 접근(Wake on approach)’, 누군가 뒤에 있으면 물리적인 보안 위협을 미연에 방지하기 위해 화면이 흐려지는 ‘개인 정보 보호 경고’ 등 다양한 보안 기능을 사용자에게 제공한다. 또한 노트북의 배터리, 펜, 프로세서를 자동 모니터링하는 기능을 탑재해 생산성을 높이고 전력 낭비를 막는다. 비즈니스용 AI PC 부문에서는 사용자의 생산성을 높이고 협업을 원활하게 도와줄 수 있는 AI 기능을 탑재한 엘리트북 x360 1040 G11(Elitebook 1040 G11), Zbook 파워 G11(Zbook Power G11)을 소개했다. 엘리트북 x360 1040 G11은 인텔 코어 울트라 5, 7 프로세서, 2.8K OLED 디스플레이, 백라이트 및 저조도 조정, 자동 프레이밍 기능이 있는 5MP 카메라를 탑재한 AI PC이다. AI 기능이 내장되면서 이전 기기 대비 그래픽 성능이 80% 개선되었으며 전력 소모량은 38% 줄였다. 또한 AI 영상 편집 속도가 최대 132% 빨라졌으며 PC 전력 자동 변화 기능을 제공하는 HP 스마트 센스(HP Smart Sense)를 통해 소음을 40%까지 낮췄다. 모바일 워크스테이션인 Zbook 파워 G11은 AI 연산에 특화된 엔비디아 그래픽카드 RTX 3000 에이다 제네레이션(Ada Generation)을 탑재해 3D 모델링, AI 기반 콘텐츠 제작과 같이 까다로운 워크플로를 빠르고 효율적으로 처리한다. IT 전문가, 크리에이티브 및 엔터테이먼트 산업 종사자, 데이터 사이언티스트와 같이 복잡한 워크플로를 다루는 사용자들도 어디서나 작업할 수 있도록 설계됐으며, Z by HP 포트폴리오에 포괄적으로 적용되는 다양한 하드웨어 및 소프트웨어 보안 솔루션을 제공한다. 한편, HP는 AI PC를 선보이며 지속가능성을 달성하기 위한 노력을 지속하겠다는 의지를 재확인했다. 기후 행동, 인권, 디지털 형평성 분야에서 '가장 지속가능하고 공정한 정보기술(IT) 기업'이 되겠다는 비전을 세운 HP는 2030년 전 제품 및 포장재의 자원 순환성 75% 달성을 목표로 세운 바 있다. HP는 이를 위해 2022년 이후 출시한 모든 PC와 디스플레이에 재생 소재를 포함해 왔으며, 이번에 공개한 모든 제품에도 재생 소재를 사용했다. HP 코리아의 김대환 대표는 “HP는 미래를 준비하자는 의미인 ‘Future Ready’ 비전의 일환으로 AI 기술을 주목했다. AI는 수십 년 만에 가장 눈에 띄게 PC 시장의 역동성을 높이고 있으며 AI는 단순히 테크 산업뿐만 아니라 모든 비즈니스 전반에 영향을 끼치며 세계에 변화를 불러일으킬 바람”이라며, “계속해 변화하는 소비자의 라이프 스타일과 시장의 게임체인저 역할을 할 AI 기술을 모든 분야의 기기에 녹여 그 어느 때보다 개인화된 PC를 제공할 예정”이라고 전했다.

작성일 : 2024-04-30

CAD&Graphics 2024년 5월호 목차

INFOWORLD Focus 17　디지털 제조 & 뿌리산업 컨퍼런스, 디지털 기술 기반의 제조산업 혁신 및 성장 전략 소개 22　빌드스마트포럼 2024, Al와 메타버스의 시너지로 변화하는 AEC 탐구 24　마이다스아이티, 제조산업을 위한 CAE 기술과 솔루션 로드맵 제시 26　로크웰 오토메이션, AI·클라우드 접목한 디지털 제조 기술 소개 28　한국산업지능화협회, ‘2024 스마트공장엑스포와 산업지능화 콘퍼런스’ 개최 51　오라클, 모던 데이터 플랫폼 및 데이터베이스 혁신 전략 발표 54　델 테크놀로지스, AI 시대 겨냥한 기업용 PC 제품군 소개 56　레노버, “더 많은 CPU 코어로 워크스테이션 성능 높인다” People&Company 30　한국알테어 이승훈 기술 총괄 본부장　더욱 빠르고 효율적인 제품 개발을 위한 AI 기술 본격화 추진 33　데이터킷 필리프 블라슈 CEO　CAD 데이터 변환과 상호운영성 기술로 한국 시장 공략 강화 Case Study 36　책임감 있는 AI 활용 및 향상된 모델 훈련　유니티 뮤즈의 텍스처/스프라이트 생성 및 파운데이션 모델 New Products 40　리브랜딩과 함께 건축 설계의 생산성 강화　캐드마스터 2025 44　AI로 생산성 높이는 기업용 PC 프로세서　라이젠 프로 8040/8000 시리즈 46　AI 기반 워크플로 강화하는 전문가용 GPU　RTX A400/A1000 48　콘텐츠 생성의 퍼포먼스와 효율 강화　언리얼 엔진 5.4 프리뷰 58　이달의 신제품 Column 62　디지털 지식전문가 조형식의 지식마당 / 조형식　디지털 엔지니어링의 프레임워크와 네 가지 스피어 64　책에서 얻은 것 No. 19 / 류용효　기업 성장 맵 – 엔비디아 편 On Air 73　캐드앤그래픽스 CNG TV 지식방송 지상중계　배터리 산업 동향과 배터리 최적화를 위한 설계/시뮬레이션 기술 60　New Books 68　News Directory 123　국내 주요 CAD/CAM/CAE/PDM 소프트웨어 공급업체 디렉토리 CADPIA AEC 74　BIM 칼럼니스트 강태욱의 이슈 & 토크 / 강태욱　오픈AI CLIP 모델의 이해/코드 분석/개발/사용 82　복잡한 모델에서 인사이트를 얻고 설계 의사결정을 돕는 직스캐드 (2) / 이소연　포인트 클라우드 기능 85　새로워진 캐디안 2024 살펴보기 (5) / 최영석　캐디안 2024의 스크립트 기능 88　데스크톱/모바일/클라우드를 지원하는 아레스 캐드 2025 (1) / 천벼리　아레스 캐드 2025의 새로운 기능 Reverse Engineering 94　문화유산 분야의 이미지 데이터베이스와 활용 사례 (5) / 유우식　고지도 데이터베이스 Analysis 103　시뮤텐스 소프트웨어를 활용한 복합소재 해석 (2) / 씨투이에스코리아　시뮤필의 복합재 수지 해석 기능 소개 106　앤시스 워크벤치를 활용한 해석 성공사례 / 노은솔　PyMAPDL의 기초부터 활용까지 110　산업 디지털 전환을 위한 버추얼 트윈 (1) / 안치우　1D 시뮬레이션을 위한 카티아 다이몰라 120　성공적인 유동 해석을 위한 케이던스의 CFD 기술 (9) / 나인플러스IT　미래 자동차 설계를 위한 DNS, LES, RANS 시뮬레이션 Mechanical 114　제품 개발 혁신을 가속화하는 크레오 파라메트릭 10.0 (12) / 김주현　사용자 정의 피처의 생성 및 활용 캐드앤그래픽스 2024년 5월호 목차 from 캐드앤그래픽스

작성일 : 2024-04-30

[이벤트] 엔비디아 OpenUSD의 다양한 활용 사례 확인하고, 커피 & 케이크 기프티콘 받아 가세요!

작성일 : 2024-04-25

스노우플레이크, 엔터프라이즈급 LLM ‘아크틱’ 출시

작성일 : 2024-04-25

엔비디아, AI 기반 워크플로 강화하는 RTX A400과 A1000 GPU 출시

엔비디아가 새로운 엔비디아 RTX A400과 RTX A1000 GPU를 통해 RTX 전문가용 그래픽 제품을 확장하고, 디자인을 비롯한 AI 기반 생산성 워크플로를 강화한다고 밝혔다. 디자인과 생산성 애플리케이션 전반에 걸친 AI 통합이 새로운 기준으로 자리잡으면서 고급 컴퓨팅 성능에 대한 수요가 증가하고 있다. 즉, 전문가와 크리에이터들은 프로젝트의 규모와 복잡성 또는 범위에 관계없이 향상된 컴퓨팅 성능을 활용해야 한다. 엔비디아 암페어(Ampere) 아키텍처 기반의 RTX A400과 RTX A1000 GPU는 이렇게 증가하는 수요를 충족하기 위해 개발됐으며, AI와 레이 트레이싱 기술에 대한 접근성을 확대해 전문가들이 일상적인 워크플로를 혁신하는데 필요한 도구를 제공한다. ▲ 엔비디아 RTX A400 RTX A400 GPU는 RTX 400 시리즈 GPU에 가속화된 레이 트레이싱과 AI를 도입했다. 이 GPU는 AI 처리를 위한 24개의 텐서 코어(Tensor Cores)를 탑재해 기존 CPU 기반 솔루션을 넘는 성능을 제공한다. 이를 통해 전문가들은 지능형 챗봇, 코파일럿과 같은 최첨단 AI 애플리케이션을 데스크톱에서 직접 실행할 수 있다. 또한 GPU는 실시간 레이 트레이싱을 제공하므로 크리에이터는 생생하고 물리적 정확도가 높은 3D 렌더링을 제작할 수 있다. A400은 시리즈 최초로 4개의 디스플레이 출력을 지원해 금융 서비스, 명령과 제어, 유통, 운송과 같은 산업에 필수적인 고밀도 디스플레이 환경에 적합하다. ▲ 엔비디아 RTX A1000 엔비디아 RTX A1000 GPU는 RTX 1000 시리즈 GPU에 처음으로 텐서 코어와 RT 코어를 도입했다. 이를 통해 전문가와 크리에이터를 위한 가속화된 AI와 레이 트레이싱 성능을 제공한다. A1000은 72개의 텐서 코어를 탑재해 이전 세대에 비해 업그레이드된 성능을 갖췄다. 스테이블 디퓨전(Stable Diffusion)과 같은 도구에서 3배 이상 빠른 생성형 AI 프로세싱을 제공하며, 18개의 RT 코어는 그래픽과 렌더링 작업 속도를 최대 3배까지 높여 2D와 3D CAD, 제품과 건축 설계, 4K 비디오 편집과 같은 전문적인 워크플로를 가속화한다. 더불어 A1000은 이전 세대보다 최대 38% 더 많은 인코딩 스트림을 처리하고 2배 더 빠른 디코딩 성능을 제공하는 등 비디오 처리 능력을 높였다. 엔비디아 RTX A400과 A1000 GPU에 탑재된 2세대 RT 코어는 건축 도면, 3D 디자인, 콘텐츠 제작 등 모든 전문 워크플로를 위한 실시간 레이 트레이싱, 사실적인 물리 기반 렌더링과 시각화, 정확한 조명과 그림자 시뮬레이션으로 작업 품질을 높일 수 있다. 3세대 텐서 코어는 생성형 AI, 이미지 렌더링 노이즈 제거, 딥러닝 슈퍼 샘플링과 같은 AI 증강 도구와 애플리케이션을 가속화해 이미지 생성 속도와 품질을 개선한다. 암페어 아키텍처 기반의 쿠다(CUDA) 코어는 이전 세대 대비 최대 2배의 단정밀도 부동 소수점 처리량으로 그래픽과 컴퓨팅 워크로드의 속도를 크게 높인다. A400 GPU의 4GB와 A1000 GPU의 8GB GPU 메모리는 다양한 전문가용 요구 사항을 충족한다. 여기에는 기본적인 그래픽 디자인과 사진 편집부터 텍스처나 고해상도 편집, 데이터 분석이 필요한 까다로운 3D 모델링 등이 포함된다. 또한 이 GPU들은 이전 세대보다 메모리 대역폭이 증가해 데이터를 더 빠르게 처리하고 대용량 데이터 세트와 장면을 더 원활하게 처리할 수 있다. 7세대 인코드(NVENC)와 5세대 디코드(NVDEC) 엔진을 탑재한 새 GPU는 효율적인 비디오 처리를 기능을 제공한다. 이를 통해 초저지연으로 고해상도 비디오 편집, 스트리밍, 재생을 지원한다. 또한 AV1 디코드가 포함돼 더 많은 비디오 포맷을 더 효율적이고 원활하게 재생할 수 있다. A400과 A1000 GPU는 싱글 슬롯 디자인에 전력소비량이 50W에 불과하며, 콤팩트하고 에너지 효율적인 워크스테이션에 인상적인 기능을 제공한다. 엔비디아는 새로운 GPU가 최첨단 AI, 그래픽, 컴퓨팅 기능 등을 통해 사용자의 생산성을 높이고 창의적인 가능성을 열어준다고 전했다. 레이 트레이싱 렌더링과 AI가 포함된 고급 워크플로를 통해 전문가들은 작업의 한계를 뛰어넘고 놀라운 수준의 사실감을 구현할 수 있다. 기획 담당자들은 강력하고 에너지 효율적인 새로운 컴퓨팅 솔루션을 에지 배포에 사용할 수 있다. 크리에이터는 편집과 렌더링 속도를 높여 더욱 풍부한 시각적 콘텐츠를 제작할 수 있다. 건축가와 엔지니어는 아이디어를 3D CAD 개념에서 실제 디자인으로 원활하게 전환할 수 있다. 스마트 공간에서 작업하는 경우에는 공간 제약이 있는 환경에서 실시간 데이터 처리, AI 기반 보안, 디지털 사이니지 관리 등에 GPU를 사용할 수 있다. 또한 의료 전문가들은 더 빠르고 정밀한 의료 영상 분석을 수행할 수 있다.

작성일 : 2024-04-18

엔비디아, AI 개발 가속화 위해 구글 클라우드와 협력

엔비디아가 구글 클라우드와 협력을 통해 전 세계 스타트업의 생성형 AI 애플리케이션과 서비스 개발 가속화를 지원한다고 발표했다. 양사의 이번 협력은 다양한 규모의 기업이 생성형 AI 애플리케이션을 개발하는데 드는 비용을 절감하고 장벽을 완화하기 위해 공개된 일련의 발표들 중 가장 최근에 이뤄진 것이다. 특히 스타트업은 AI 투자에 대한 높은 비용으로 인해 많은 제약을 받고 있다. 이번 협업으로 엔비디아와 구글 클라우드는 클라우드 크레딧, 시장 진출 지원, 그리고 기술 전문 지식에 대한 접촉 기회 확대를 통해 고객에게 더 빠르게 스타트업의 가치를 제공하도록 지원한다. 1만 8000개 이상의 스타트업을 지원하는 엔비디아 인셉션 글로벌 프로그램의 회원은 특히 AI에 중점을 둔 스타트업의 경우 최대 35만 달러의 구글 클라우드 크레딧을 제공받고 구글 클라우드 인프라 사용 가속화 경로를 확보할 수 있다. 구글 포 스타트업 클라우드 프로그램 멤버는 엔비디아 인셉션에 가입해 기술 전문 지식, 엔비디아 딥 러닝 인스티튜트(Deep Learning Institute) 과정 크레딧, 엔비디아 하드웨어와 소프트웨어 등을 이용할 수 있다. 또한 구글 포 스타트업 클라우드 프로그램의 스타트업 회원은 해당 분야에 관심이 있는 벤처 투자 기관에 노출될 기회를 주는 엔비디아 인셉션 캐피탈 커넥트(Inception Capital Connect) 플랫폼에 참여할 수 있다. 두 프로그램 모두에서 급성장한 신생 소프트웨어 제조업체는 구글 클라우드 마켓플레이스(Marketplace) 등록해 공동 마케팅, 제품 개발 가속화 지원을 우선적으로 받을 수 있다. 구글 딥마인드(DeepMind)는 지난 2월 최첨단 개방형 모델 제품군 젬마(Gemma)를 공개했는데, 엔비디아는 최근 구글과 협력해 모든 젬마 전용 엔비디아 AI 플랫폼에 대한 최적화를 실시했다. 젬마는 구글 딥마인드의 가장 뛰어난 모델인 제미나이(Gemini) 제작에 사용된 동일한 연구와 기술로 구축됐다. 양사의 긴밀한 협력으로 거대 언어 모델(LLM) 추론 최적화를 위한 오픈 소스 라이브러리 엔비디아 텐서RT-LLM(TensorRT-LLM)을 통해 엔비디아 GPU로 젬마를 실행, 젬마의 성능을 발전시켰다. 젬마 7B(Gemma 7B), 리커런트젬마(RecurrentGemma), 코드젬마(CodeGemma)를 포함한 젬마 모델 제품군은 엔비디아 API 카탈로그에서 사용 가능하며, 사용자는 이를 브라우저에서 사용하거나, API 엔드포인트로 프로토타입을 제작하거나, NIM을 통한 셀프 호스팅을 할 수 있다. 구글 클라우드를 사용하면 GKE와 구글 클라우드 HPC 툴킷으로 플랫폼 전반에 엔비디아 네모(NeMo) 프레임워크를 배포하기 쉬워진다. 이를 통해 개발자는 생성형 AI 모델의 훈련과 제공을 확장하고 자동화할 수 있으며, 개발 과정에 빠르게 착수하는 맞춤형 청사진을 통해 턴키 환경을 신속히 구축할 수 있다. 엔비디아 AI 엔터프라이즈의 일부인 엔비디아 네모는 구글 클라우드 마켓플레이스에서도 이용 가능하다. 이를 통해 고객들은 네모 및 기타 프레임워크에 쉽게 액세스해 AI 개발을 가속할 수 있다. 구글 클라우드는 엔비디아 생성형 AI 가속 컴퓨팅의 가용성 확대를 위해 5월 A3 메가(Mega)의 정식 출시를 발표했다. 이 인스턴스는 엔비디아 H100 텐서 코어(H100 Tensor Core) GPU로 구동되는 A3 가상 머신(VM) 제품군의 확장으로, A3 VM에서 GPU 대 GPU 네트워크 대역폭이 두 배로 늘었다. A3에 탑재된 구글 클라우드의 새로운 컨피덴셜(Confidential) VM에는 컨피덴셜 컴퓨팅에 대한 지원도 포함돼 있어, 고객이 H100 GPU 가속에 액세스하는 동안 코드를 변경하지 않고도 민감 데이터의 기밀성과 무결성을 보호하고 학습과 추론 도중 애플리케이션과 AI 워크로드를 보호할 수 있다. 이 GPU 기반 컨피덴셜 VM은 올해 미리보기로 제공될 예정이다. 한편, 블랙웰(Blackwell) 플랫폼에 기반한 엔비디아의 최신 GPU는 2025년 초에 엔비디아 HGX B200과 엔비디아 GB200 NVL72 등 두 가지 버전으로 구글 클라우드에 출시될 예정이다. HGX B200은 가장 까다로운 AI, 데이터 분석 그리고 고성능 컴퓨팅 워크로드를 위해 설계됐으며, GB200 NVL72는 차세대, 대규모, 조 단위의 매개변수 모델 학습과 실시간 추론을 위해 설계됐다. 엔비디아 GB200 NVL72는 각각 2개의 엔비디아 블랙웰 GPU와 엔비디아 그레이스 CPU(Grace CPU)가 결합된 36개의 그레이스 블랙웰 슈퍼칩을 900GB/s의 칩투칩(chip-to-chip) 인터커넥트를 통해 연결한다. 이는 하나의 엔비디아 NV링크(NVLink) 도메인에서 최대 72개의 블랙웰 GPU와 130TB/s의 대역폭을 지원한다. 통신 병목 현상을 극복하고 단일 GPU처럼 작동해 이전 세대 대비 30배 빠른 실시간 LLM 추론과 4배 빠른 트레이닝을 제공한다. 엔비디아는 지난 3월 생성형 AI의 요구사항에 최적화된 엔터프라이즈 개발자용 AI 플랫폼인 엔비디아 DGX 클라우드를 H100 GPU 기반의 A3 VM에서 사용할 수 있다고 발표했다. GB200 NVL72가 탑재된 DGX 클라우드는 2025년 구글 클라우드에서도 제공될 예정이다.

작성일 : 2024-04-12

인텔, 기업용 AI를 위한 ‘가우디 3’ 및 AI 개방형 시스템 전략 발표

인텔은 연례 고객 및 파트너 콘퍼런스인 ‘인텔 비전 2024’에서 기업용 생성형 AI를 위한 성능, 개방성 및 선택권을 제공할 인텔 가우디 3(Intel Gaudi 3) 가속기를 공개했다. 그리고 이와 함께 생성형 AI 도입 가속화를 위한 새로운 개방형 스케일러블 시스템 스위트, 차세대 제품 및 전략적 협력도 발표했다. 인텔 가우디 3 AI 가속기는 공통 표준을 따르는 이더넷을 통해 최대 수만 개의 가속기를 연결해 AI 시스템을 구동한다. 인텔 가우디 3는 BF16에 대해 4배 더 많은 AI 컴퓨팅 및 기존 모델 대비 1.5배 커진 메모리 대역폭을 지원한다. 인텔은 “이 가속기는 생성형 AI를 대규모로 배포하려는 글로벌 기업에게 AI 학습 및 추론 분야에서 획기적인 도약을 지원할 수 있다”고 설명했다. ▲ 인텔 팻 겔싱어 CEO 인텔은 가우디 3가 70억 개 및 130억 개의 매개변수가 있는 라마2(Llama2) 모델과 GPT-3 1750억개 매개변수 모델 전체에서 엔비디아 H100보다 평균 50% 더 빠른 학습 시간을 제공할 것으로 예상하고 있다. 또한 인텔 가우디 3 가속기 추론 처리량은 평균적으로 H100보다 50%, 전력 효율성의 경우 라마(Llama) 70억 개 및 700억 개 매개변수와 팔콘(Falcon) 1800억 개 매개변수 모델에서 평균 40% 더 우수할 것으로 예상한다. 인텔 가우디 3는 개방형 커뮤니티 기반 소프트웨어와 업계 표준 이더넷 네트워킹을 제공한다. 또한 기업은 싱글 노드에서 클러스터, 슈퍼 클러스터, 수천 개의 노드가 있는 메가 클러스터로 유연하게 확장할 수 있으며, 최대 규모의 추론, 미세 조정 및 학습을 지원한다. 인텔 가우디 3는 2024년 2분기에 델 테크놀로지스, HPE, 레노버, 슈퍼마이크로를 비롯한 OEM 시스템에 탑재될 예정이다. 또한 인텔은 하드웨어, 소프트웨어, 프레임워크, 툴 등을 포함한 개방형 스케일러블 AI 시스템에 대한 전략을 제시했다. 인텔의 이러한 접근법은 기업별 생성형 AI 요구 사항을 충족하는 솔루션을 제공하기 위한 것으로, 다양하고 개방적인 AI 생태계를 가능케 한다. 여기에는 장비 제조업체, 데이터베이스 공급자, 시스템 통합업체, 소프트웨어 및 서비스 공급자 등이 포함된다. 또한, 기업 고객이 이미 알고 신뢰하는 생태계 파트너 및 솔루션을 활용할 수 있는 부분도 장점으로 꼽힌다. 인텔은 다양한 업계의 기업 고객 및 파트너들과 새롭고 혁신적인 생성형 AI 응용 프로그램을 개발하기 위해 인텔 가우디를 활용해 협력하고 있다고 밝혔다. 예를 들어, 네이버는 클라우드에서부터 온디바이스까지 첨단 AI 서비스를 전세계에 배포하기 위해 강력한 LLM 모델을 개발하고 있는데, 대규모 트랜스포머 아키텍처 기반 모델의 컴퓨팅 작업을 뛰어난 와트 당 퍼포먼스로 실행하기 위해 인텔 가우디를 사용한다. 보쉬는 자사 기반 모델 개발을 포함한 스마트 제조의 가능성을 모색하고 있으며, 합성 데이터 세트 생성과 더불어 자동 광학 검사와 같은 견고하고 분산된 트레이닝 세트 제공한다. 이에 더해 구글 클라우드, 탈레스, 코히시티(Cohesity)가 클라우드 환경에서 기밀 컴퓨팅 역량을 활용할 수 있도록 인텔과의 협력을 발표했다. 인텔은 인텔 가우디 3 가속기 외에도 엔터프라이즈 AI의 모든 부문에 걸쳐 차세대 제품 및 서비스에 대한 업데이트를 발표했다. 새로운 인텔 제온 6 프로세서는 폐쇄적 데이터를 사용하여 비즈니스에 특화된 결과를 생성하는 RAG를 포함한 최신 생성형 AI 솔루션을 실행할 수 있다. 2024년 출시될 차세대 인텔 코어 울트라 클라이언트 프로세서 제품군(코드명 루나레이크)은 차세대 AI PC를 위해 플랫폼 기준 100 TOPS 이상, NPU에서 45TOPS 이상을 제공할 예정이다. 인텔은 울트라 이더넷 컨소시엄(UEC)을 통해 AI 패브릭을 위한 개방형 이더넷 네트워킹을 선도하며 다양한 AI 최적화 이더넷 솔루션을 선보이고 있다. 인텔의 팻 겔싱어(Pat Gelsinger) CEO는 “혁신은 전례 없는 속도로 발전하고 있으며, 반도체가 이 모든 것을 가능하게 한다. 또한 모든 기업이 빠르게 AI 기업으로 거듭나고 있다”면서, “인텔은 PC부터 데이터센터, 에지에 이르기까지 기업 전반의 모든 곳에 AI를 가능하게 하고 있다. 인텔의 최신 가우디, 제온 및 코어 Ultra 플랫폼은 변화하는 고객과 파트너의 요구를 충족하고 앞으로의 엄청난 기회를 활용할 수 있도록 유연한 솔루션 세트를 제공하고 있다”고 밝혔다.

작성일 : 2024-04-11